面向自然场景的端对端英文文字识别研究

面向自然场景的端对端英文文字识别研究

作者:师大云端图书馆 时间:2020-05-07 分类:硕士论文 喜欢:2085
师大云端图书馆

【摘要】随着移动互联网的飞速发展及智能手机等移动电子设备的普及,自然场景图像的获取和传输变得越来越便捷。自然场景图像中的文本包含了丰富的信息,人们期待计算机能代替人类自动地检测并提取图像的文本信息。与传统的光学字符识别不同,自然场景中的文本信息提取面临着字体多变、布局不一、背景复杂等问题。近年来,面向自然场景的文本识别研究虽然取得了一定的成果,但是与实际应用的要求还存在较大的差距。因此,面向自然场景的端对端英文文字识别方法的研究不仅具有重要的理论研究意义,而且具有广阔的应用前景。本文旨在从自然场景图像中提取精确文本位置和正确的文本信息,并构建一个端对端的场景文本识别系统。针对现有研究方法中字符图像特征表示能力不足及过分依赖复杂模型等问题,本文主要开展以下三方面的研究:(1)自然场景中字符的无监督特征提取及其分层表示;(2)自然场景中的文本定位:(3)自然场景中端对端的文字识别系统的框架。本文的主要贡献如下:1.提出了基于卷积神经网络的无监督特征分层表示算法。我们先利用改进的K-means聚类方法从训练数据中获得基向量,再结合卷积神经网络提取字符图像的特征。2.提出了由字符到字符串,再到单词的文本分层定位框架。采用最大稳定极值区域(MSER)算法提取字符候选区域。根据字符的空间布局等特征对多层特征过滤后的字符候选区域进行融合。设计了字符串的结构特征,进一步提高文本检测的准确率。3.设计了端对端的场景文字识别算法框架,实现了实验演示系统。我们把文本检测与字符识别模块进行整合,并设计了基于词典的识别矫正方法。实验结果验证了所提文本识别方法的有效性。
【作者】廖威敏;
【导师】曲延云;
【作者基本信息】厦门大学,计算机应用技术,2014,硕士
【关键词】字符识别;文本检测;无监督特征学习;最大稳定极值区域;自然场景;

【参考文献】
[1]肖德军.平衡计分卡在四川网信软件公司研发体系人力资源绩效评估与激励中的应用研究[D].西南财经大学,工商管理,2004,硕士.
[2]赵娜.保定市高校大学生择业意向研究[D].河北大学,人口学,2014,硕士.
[3]赵泽.带钢运行监控系统的设计与实现[D].复旦大学,电路与系统,2012,硕士.
[4]席裕庚,耿晓军.连续非线性系统预测控制的次优性分析[J].自动化学报,1999,05:673-676.
[5]胡爱莉.《世界历史百科全书》(第十一卷节选)翻译项目报告[D].安徽大学,英语翻译(专业学位),2013,硕士.
[6]豆振领.基于电子有效质量的Drude修正模型优化分析及其应用研究[D].兰州大学,无线电物理,2013,硕士.
[7]赖柳萍.莆田涵江镇传统民居建筑形态研究[D].华侨大学,建筑学(专业学位),2014,硕士.
[8]张庆勇.残余应力对海洋耐压结构承载极限影响研究[D].哈尔滨工业大学,船舶与海洋工程,2014,硕士.
[9]陈文腾.克服耐药的非可逆EGFR抑制剂的设计、合成及生物活性筛选和类药性化合物库的构建[D].浙江大学,药物化学,2013,博士.
[10]陈志华,葛玉卿,金庆辉,柳建设,赵建龙.石墨烯复合修饰电极的电化学应用[J].化学传感器,2010,04:9-13.
[11]李丽.集装箱码头物流系统仿真研究[D].武汉理工大学,机械设计及理论,2004,硕士.
[12]张雅.数字技术在舞台设计上的应用研究[D].天津音乐学院,艺术管理,2014,硕士.
[13]吴平.一维复合纳米结构锂离子电池负极材料的制备、表征及应用[D].浙江大学,2012.
[14]翟睿,焦丰龙,林虹君,郝斐然,李佳斌,颜辉,李楠楠,王欢欢,金祖耀,张养军,钱小红.金属有机框架材料的研究进展[J].色谱,2014,02:107-116.
[15]汤浩.九相感应电机矢量控制系统的研究[D].浙江大学,2013.
[16]杨拥民.自适应调节器在电弧炉控制中的应用[J].自动化学报,1998,02:136-139.
[17]杨明.论杭州方言对英语词首辅音丛习得的影响[D].浙江大学,外国语言学及应用语言学,2013,硕士.
[18]何飞.外资并购中国汽车产业的绩效研究[D].南京农业大学,金融学,2012,硕士.
[19]王新慧.Fe_3O_4/石墨烯纳米复合材料的制备及在锂离子电池中的应用[D].山西师范大学,2014.
[20]龚圆渊.六味地黄丸联合bFGF诱导骨髓间充质干细胞向神经元样细胞分化的研究[D].成都中医药大学,人体解剖与组织胚胎学,2012,硕士.
[21]王征.普通高校武术选修(项)课中应用视频—反馈法的实验研究[D].河北师范大学,体育教育训练学,2012,硕士.
[22]欧恒然.制造业上市企业现金持有量对投资影响研究[D].西南大学,会计学,2014,硕士.
[23]张悦.猪肺炎支原体P65蛋白的克隆表达、单克隆抗体制备及阻断ELISA抗体检测方法建立[D].南京农业大学,预防兽医学,2013,硕士.
[24]袁巍.中国行政文化中的游民意识及其消解[D].吉林大学,行政管理,2013,硕士.
[25]吴王平.基于J2EE的高校采购系统的研究与设计[D].浙江工业大学,2009.
[26]藏明君,张树有,郏维强,徐敬华.基于领地行为的多目标粒子群算法及在板翅换热器设计中的应用[J].计算机集成制造系统,2015,01:76-87.
[27]刘斐.目标周界智能视频监控背景建模技术研究[D].国防科学技术大学,电子与通信工程,2013,硕士.
[28]丁丽玮.职业兴趣探查量表(OIPs)简版的初步修订[D].扬州大学,应用心理学,2011,硕士.
[29]曹燕.诺舒(Nova Sure)阻抗控制子宫内膜消融术治疗异常子宫出血50例临床分析[D].吉林大学,临床医学,2014,硕士.
[30]万敏.收入分配与个人所得税政策研究[D].贵州财经大学,财政学,2013,硕士.
[31]李沫潼.音乐治疗对中学生考试焦虑心理干预的实践研究[D].天津音乐学院,音乐学,2014,硕士.
[32]李勇.基于DSP的三相PFC电路研究[D].西安科技大学,电路与系统,2014,硕士.
[33]韩海姣.导引头钢丝绳传动张紧装置研制及加速寿命试验模型研究[D].哈尔滨工业大学,机械设计及理论,2013,硕士.
[34]缪杰.基于百度指数的投资者关注度对于股票市场表现的影响[D].厦门大学,财务学,2014,硕士.
[35]吴昊.上海社区居民常见风湿性疾病流行病学调查[D].复旦大学,临床医学(专业学位),2013,博士.
[36]周猛飞,肖成松,逯振飞,蔡亦军,潘海天.基于UKF的滚动时域估计方法研究[J].计算机与应用化学,2013,12:1406-1410.
[37]蔡云飞,唐振民,张浩峰.基于Cross-EKF定位的多机器人协作围捕策略研究[J].控制与决策,2010,09:1313-1317+1323.
[38]滕羲瑶.碳纳米材料的合成及其应用研究[D].安徽大学,2014.
[39]周炜佳.地域性油画创作中对少数民族人物形象特征的分析研究[D].新疆师范大学,美术学,2013,硕士.
[40]王兵,王长友,李越冬.社会转型与国家审计的治理功用:基于嵌入理论的视角[J].审计与经济研究,2014,04:14-21.
[41]王勇志.基于时域传输原理的土壤水分测试仪的研究与开发[D].北京林业大学,控制理论与控制工程,2013,硕士.
[42]熊玉卿,罗崇泰,张浩力,周凯歌.导电聚合物的制备及其性能研究[A].中国真空学会薄膜专业委员会.TFC’09全国薄膜技术学术研讨会论文摘要集[C].中国真空学会薄膜专业委员会:,2009:1.
[43]胡则.基于网络化视角下企业集团股权控制模式研究[D].宁波大学,企业管理(专业学位),2012,硕士.
[44]汪际峰,周华锋,熊卫斌,牛振勇.复杂电力系统运行驾驶舱技术研究[J].电力系统自动化,2014,09:100-106+131.
[45]康文越.地佐辛预处理对开胸患者术后镇痛的影响[D].吉林大学,临床医学,2014,硕士.
[46]王保仓.基于有扰认证信道的信息理论安全密钥协商[D].西安电子科技大学,密码学,2004,硕士.
[47]张亮.冲压成形数值仿真及人工神经网络预测的研究[D].长春工业大学,机械制造及其自动化,2013,硕士.
[48]谢晴.论我国刑事诉讼证据开示制度的建构[D].苏州大学,法律,2003,硕士.
[49]刘旭.虚不失其重——论古汉语虚词的英译[D].武汉理工大学,外国语言学及应用语言学,2004,硕士.
[50]陆续常.KZL-Ⅱ型锅炉的五项安全措施[J].劳动保护.1986(04)

相关推荐
更多